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(57) Resumen: La invencion proporciona una molecula de ADN proveniente de maiz y codificante de una protefna con actividad 

TGasa, asfcomo un vector de expresi6n g£nica que comprende esta molecula de ADN. Un objeto adicional de esta invencion lo 

constituye el empleo de dicha molecula de ADN o vector para producir celulas transformadas capaces de expresar proteinas re- 
combinantes con actividad TGasa, o para introducir dicha secuencia codificante de una protefna con actividad TGasa en celulas 
de plantas. Las celulas de microorganismos y las plantas transgSnicas resultantes tambien constituyen objetos adicionales de esta 
invention. Adem£s, estas proteinas con actividad TGasa expresadas a partir de dichas secuencias de ADN pueden ser empleadas, 
^ entre otros usos, en la manipulation, procesamiento y transformaci6n de alimentos. 
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SECUENCIA DE NUCLEOTIDOS DE MAIZ CODIFICANTE DE UNA 
PROTEEVA CON ACTIVIDAD TRANSGLUTAMINASA, Y SU USO. 

5 

SECTOR DE LA TECNICA 

La invencion se relaciona con la identificacion de nuevas proteinas de origen 
vegetal con actividad TGasa y su uso en el campo de la manipulation, procesamiento y 
transformation de alimentos y en el desarrollo de plantas transgenicas con nuevas 
10 capacidades. 

ESTADO DE LA TECNICA 

Las trans glutaminas as (TGasa; EC2.3.2.13) (R-glutaminil-peptido-aminasa-y- 
glutamil transferasa) catalizan uniones amidas entre un grupo amino primario de una 

15 poliamina o de una lisina (donador amino) y ion grupo y-carboxiamida de un residuo 
glutamil de algunas proteinas (amino receptor), mediante una reaccion intermedia por la 
que el enzima se une al sustrato por reaccion entre el grupo y-carboxiamida del residuo 
glutamil de la proteina y un grupo sulfidrilo de un residuo de cisteina del centro activo 
del enzima (Serafini-Fracassini, D., Del Duca, S., & Beninati, S. 1995. Plant 

20 Transglutaminases. Phytochemistry 40: 355-365). El resultado de la actividad de la 
TGasa es: a) la modification de la conformation de la propia proteina y b) otros 
cambios de conformaci6n m&s extensos como resultado de uniones entre la misma 
proteina y entre proteinas diferentes para formar conjugados de elevado peso molecular. 
Existen estudios con TGasas en humanos, tambien en animates, plantas, 

25 vertebrados inferiores, algunas bacterias, algas y levaduras (Makarova, K.S., Aravind, 
L. & Koovin, E.V. 1999. A superfamily of archaeal, bacterial, and eukaryotic proteins 
homologous to animal transglutaminases. Protein Science 8:1714-1719; Bergamini, 
CM., Dean, M., Tanfani, F., Ferrari, C. & Scatturin. 1999. Conformational stability of 
human erythrocyte transglutaminase: patterns of thermal unfolding at acid and alkaline 

30 pH. Eur. J.Biochem. 266:575-582.; Cariello, L, Ristoratore, F. & Zanitti, L. 1997. A 
new transglutaminase-like from ascidian Ciona intestinalis. FEBS Lett 408:171-176; 
Lorand, L. & Conrad, S.M. 1984. Transglutaminases. Mol Cell Biochem 58:9-35; 
Serafini-Fracassini, D., Del Duca S. & Beninati S. 1995. Plant Transglutaminases. 
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Phytochemistry 40:355-365 ; Tokunaga, F., Muta, T., Iwanaga, S., Ichinose, A., Davie, 
EW, Kuma, K. & Miyata, T. 1993. Limulus hemocyte transglutaminase. cDNA cloning, 
amino acid sequence and tissue localization. J Biol Chem 268:262-268). 

Las TGasas mas conocidas son: el factor XIII de la coagulaci6n de la sangre, que 
es una proteina del plasma, y la TGasa K implicada en la formacion de la capa cornea 
de la epidermis. Por otro lado, ya han sido clonados algunos de los genes responsables 
de algunas de las TGasas citadas y se va conociendo la implication de las TGasas en 
importantes procesos como la diferenciacion celular, la estabilizacion de tejidos o la 
muerte celular programada (Ichinose, A., Bottenus, R.E. & Davie E.W. 1990. Structure 
of transglutaminases. J. of Biol. Chemistry. 265(23): 13411-13414; Bergamini, CM., 
Dean, M., Tanfani, F., Ferrari, C. & Scatturin. 1999. Conformational stability of human 
erythrocyte transglutaminase: patterns of thermal unfolding at acid and alkaline pH. 
Eur. J.Biochem. 266: 575-582; Nemes ,Z., Marekov, L.N. & Steinert, P.M. 1999. 
Involucrin cross-linking by transglutaminase 1. J. of Biol. Chemistry. 274(16): 11013- 
11021). Tambien estas enzimas parecen estar implicadas en enfermedades 
neurodegenerativas, tumores, enfermedades celiacas, etc, por ello son un grupo de 
enzimas de alto interes en los estudios cllnicos. En torno a estos estudios clinicos 
existen diferentes patentes relacionadas con TGasas: US5,736,132 'Method of 
promoting adhesion between tissue surfaces" solicitada por Orthogene, Inc. 1998; US 
5,726,051 'Transglutaminase gene" solicitada por Oklahoma Medical Research 
Foundation, 1998. 

La funci6n de las TGasas vegetales es menos conocida aunque los primeros 
datos sobre su existencia se publicaron hace ya unos afios (Icekson I. & Apelbaun, A. 
1987. Evidences for transglutaminase activity in plant tissue. Plant Physiol. 84. 972- 
974; Serafini-Fracassini D., Del Duca S., & D'Orazi D. 1988. First evidence for 
polyamine conjugation mediated by an enzyme activity in plants. Plant Physiol. 
87:757). Los estudios en plantas se han centrado sobre todo en aspectos bioquimicos 
relacionados con la actividad, sustratos sobre los que actiia y tejidos donde abunda, pero 
no se ha estudiado su papel funcional en los muchos procesos en que se tienen datos 
parciales sobre su intervention, como son: crecimiento y desarrollo, morfogenesis en 
general, fotosintesis y muerte celular (Margosiak, S.A., Drama,A., Bruce-Carver, M.R., 
Gonzalez, A.P. Louie, D. & Kuehn. 1990. Identification of the large subunit of 
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ribulosel,5-bisphosphate carboxylase/oxigenase as a substrate for transglutaminase in 
Medicago sativa L. (Alfalfa). Plant Physiol. 92: 88-96; Del Ducca, S., Tidu, V., Bassi, 
R., Exposito, C, & Serafini-Fracassini, D. 1994. Identification of chloropbyll-a/b 
proteins as substrates of transglutaminase activity in isolated chloroplasts of Helianthus 
tuberosus L. Planta 193: 283-289; Del Ducca, S., Delia Mea, M., Munoz de Rueda, P. & 
Serafini-Fracassini, D. 2000 Factors affecting transglutaminase activity catalizing 
polyamine conjugation to endogenous substrates in the entire chloroplast. Plant Physiol 
Biochem 38:429-439) 

Ademas, se ha de destacar que la transglutaminasa tiene un valor anadido para 
finalidades biotecnologicas. Esta nueva faceta suplementaria como metaboUto de 
interes, proviene de su capacidad de crear uniones covalentes entre proteinas distintas. 
Esta propiedad se ha usado por ejemplo para mantener la textura de ahmentos como 
pescado y carnes, reduciendo la necesidad de utilizar sales (surimi, etc). Para la 
formulacion de gelatinas de distinta densidad etc. Para preparar cocinados con menos 
grasas (tofu). Tambien es capaz de mantener la consistencia, elasticidad, humedad o 
viscosidad de un producto en diferentes temperaturas. Se usa asimismo en distintos 
procesados lacticos: quesos, yogures, helados, etc. Tanto es asf, que actualmente se usa 
como "aditivo" en muchos procesados bioalimentarios, siendo la dosis recomendada en 
USA para este uso de 65 ppm. 

Todas estas posibilidades de la TGasa han generado la formulacion de diferentes 
patentes sobre: m6todos de obtencion, utilizacion etc. y han hecho de esta substantia un 
producto comercial como por ejemplo los que viene distribuyendo la empresa 
Ajinomoto, con el nombre de: Activa TG®. Las empresas que comerciahzan el 
producto son Ajinomoto Co. Inc de Tokio (extendida tambien en Norteam6rica) y 
Rohm Enzyme de USA (www.skidmore- 

sales.com/whatsnew/newsletter/summer2001.pdf). Sin embargo, en Espana no se ha 
localizado ninguna empresa que se dedique a la produccion industrial de TGasa. 

La primera TGasa que se ha sobreexpresado para fines comerciales como los 
antes indicados, se realizo en bacterias {Streptoverticillium sp.) por la empresa 
Ajinomoto, qui6n patent6 el procedimiento y las diferentes mejoras posteriores de este 
protocolo initial (US5,156,956 "Transglutaminase" (1992)). Asimismo esta misma 
empresa tiene patentado, otro sistema similar, pero mediante la transformaci6n de 
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Crassostrea gigas (US5,736,356 transglutaminase originating from Crassostrea 
gigas" (1998)) y de Bacillus subtilus (US5,948,662 "Bacillus-derived transglutaminase" 
(1999)). 

5 En los ultimos anos, el grupo de investigation autor de la presente invention ha 

realizado asimismo trabajos previos a nivel bioqulmico, sobre la implication de la 
TGasa en la morfogenesis de callos de maiz y su relacion con la luz (Bernet, E., 
Claparols, L, Dondini, L., Santos, M.A., Serafini-Fracassini, D. & Tome, J.M*. 1999. 
Changes in polyamine content, arginine and ornithine decarboxylases and 

10 transglutaminase activities during Ught/dark phases (of initial differentiation) in maize 
calluses and their chloroplast. Plant Physiol Biochem. 37(12): 899-909). Adem£s, 
recientemente se ha publicado la inmunolocalizacion de este enzima en distintos 
sistemas celulares de maiz, en relacion con el desarrollo de los cloroplastos (Villalobos, 
E., Torn6, J.M., OU6s, C, Claparols, L & Santos, M.A. 2001. Subcellular localization of 

15 a transglutaminase related to grana development in different maize cell types. 
Protoplasma. 216: 155-163). Sin embargo, no se han encontrado resultados sobre la 
identification molecular y actividad funcional con transglutaminasas vegetales, por lo 
que es de alto interns comercial nuevos conocimientos sobre dichas transglutaminasas. 

20 DESCRIPCI6N de la INVENCI6N 
Descripci6n breve 

La invencion se enfrenta con el problema asociado con la escasez de TGasas de 
origen vegetal necesarias en el campo de la manipulation y transformation de alimentos 
y en el desarrollo de plantas transgenicas con nuevas capacidades. 
25 La soluci6n proporcionada por esta invencion se basa en que los inventores han 

identificado unas secuencias de ADN con actividad TGasa (TGasa; EC2.3.2.13) apartir 
del maiz. La actividad TGasa de las protelnas codificadas a partir de dichas secuencias 
de ADN se ha puesto de manifiesto en experimentos a partir de extractos de estas 
proteinas. 

30 Por tanto, un objeto de esta invenci6n lo constituyen dichas molecvilas de ADN. 

Otro objeto adicional de esta invencion lo constituye un vector que comprende, 
al menos, una de dichas moteculas de ADN. 
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Un objeto adicional de esta invencion lo constituye el empleo de dichas 
moleculas de ADN o de dichos vectores, para producir celulas transformadas capaces de 
expresar proteinas recombinantes con actividad TGasa, o para introducir dicha 
5 secuencia codificante de una proteina con actividad TGasa en celulas de plantas. Las 
celulas de microorganismos y las plantas transgenicas resultantes tambien constituyen 
objetos adicionales de esta invencion; 

Un objeto adicional de la presente invencion lo constituye las proteinas con 
actividad TGasa expresadas a partir de dichas secuencias de ADN y su empleo en la 
10 manipulation y transformation de alimentos. 

Descripcion Detallada de la invencion 

La invencion proporciona una molecula de ADN, en adelante molecula de ADN 
de la invenci6n, proveniente de plantas y codificante de una proteina con actividad 
15 TGasa que comprende una secuencia de nucleotidos seleccionada entre: 

a) la secuencia de nucleotidos identificada como SEQ ID NO 1, SEQ ID 
NO 3 o un fragmento de la misma; y 

b) una secuencia de nucleotidos analoga a la secuencia definida en a), 

En el sentido utilizado en esta descripci6n, el termino "analoga" pretende incluir 
20 a cualquier secuencia de ADN que pueda ser aislada o construida en base a la secuencia 
de nucleotidos mostrada en la SEC. ID. NO 1 6 a la SEQ ID NO 3, por ejemplo, 
mediante la introducci6n de sustituciones de nucle6tidos conservativas o no 
conservativas, incluyendo la inserci6n de uno o mas nucleotidos, la adicion de uno o 
m£s nucle6tidos en cualquiera de los extremos de la molecula o la deletion de uno o 
25 mis nucle6tidos en cualquier extremo o en el interior de la secuencia. 

En general, una molecula de ADN analoga es sustancialmente homologa a la 
secuencia de nucleotidos identificada como la SEQ. ED. NO: 1 6 SEQ ID NO 3. En el 
sentido utilizado en esta descripcion, la expresion "sustancialmente homologa" significa 
que las secuencias de nucleotidos en cuestion tienen un grado de identidad, a nivel de 
30 nucleotidos, de, al menos, un 60%, preferentemente de, al menos un 85%, o mas 
preferentemente de, al menos, un 95%. 

La molecula de ADN de la invencion procede de maiz y puede encontrarse en 
formas parecidas en otras especies de plantas superiores, entre otras: arroz, trigo, 
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Arabidopsis, etc, donde pueden estar de forma natural o en otro caso, tambien podrian 
estar como resultado de un proceso de transformation genica en el que el organismo 
transformado reproduzca dichas moleculas de ADN. La molecula de ADN de la 
invention puede ser aislada, mediante tecnicas conventional, a partir del ADN de 
cualquier planta que la contenga, mediante el empleo de sondas o de oligonucleotides, 
preparados gracias a la information de la secuencia de nucleotidos de dicha molecula de 
ADN, proporcionada en esta invenci6n. 

La molecula de ADN de la invention incluye los firagmentos de la misma que 
presentan dicha actividad GTasa. 

En una realization particular, la molecula de ADN de la invention es una 
molecula de ADN de maiz de SEQ ID NO 1 6 de SEQ ID NO 3. 

La molecula de ADN de la invention puede ser utilizada, en general, en la 
generation de un vector de expresi6n, en adelante vector de expresion de la invention, 
que permite la expresion de estas protemas con actividad TGasa en una amplia gama de 
c61ulas huesped. En general, el vector de expresion de la presente invention comprende, 
al menos, una secuencia de ADN de la invention y, al menos, un promoter que dirige la 
transcripci6n del gen de interes, al que esti operativamente enlazado, y otras secuencias 
necesarias o apropiadas para la transcipcion del gen de interes y su regulation adecuada 
en tiempo y lugar, por ejemplo, senales de inicio y termination, sitios de corte, senal de 
poliadenilacion, origen de replication, activadores transcripcionales (enhancers), 
silenciadores transcripcionales (silencers), etc. Ejemplos de vectores de expresion 
apropiados pueden seleccionarse acuerdo con las condiciones y necesidades de cada 
caso concreto entre plasmidos, cromosomas artificiales de levadura (YACs), 
cromosomas artificiales de bacteria (BACs), cromosomas artificiales basados en el 
bacteriofago PI (PACs), c6smidos o virus, que pueden contener, adem&s, un origen 
bacteriano o de levadura de replicaci6n para que pueda ser amplificado en bacterias o 
levaduras, asi como un marcador utilizable para seleccionar las celulas transfectadas 
diferente al gen o genes de interes. Por tanto, la invenci6n tambien se refiere a un vector 
que comprende una molecula de ADN de la invention. La election del vector dependera 
de la c61ula hospedadora en la que se va a introducir posteriormente. A modo de 
ejemplo, el vector donde se introduce dicha secuencia de ADN puede ser un pl&smido 
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que, cuando se introduce en una celula hospedadora, se integra en el genoma de dicha 
celula y se replica junto con el cromosoma de la celula huesped. 

El vector de la invention puede ser obtenido por metodos convencionales 
5 conocidos por los tScnicos en la materia (Kovesdi et al. 1997. Curr Opin Biotech 8:583- 
589 Transgenic Res. 10:83-103; Coffin et al. 1998. Retroviruses, CSHLP; Robbins et al. 

1998. Trends Biotech. 16:35-40; Anderson. 1998. Nature 392:25-30; Schindelhauer. 

1999. BioEssays 21:76-83). Un objeto particular de la presente invention lo constituye 
los pl&smidos pGEMTIS y el pGEMT21 que contienen las SEQ ID NO 1 y SEQ ID NO 

10 3, respectivamente. 

La invention tambien proporciona una celula que comprende una molecula de 
ADN o vector de expresion de la invention. Las celulas hospedadoras que se pueden 
transfonnar con dicho vector de expresion pueden ser, por ejemplo, celulas bacterianas 
y levaduras GRAS. Estas celulas que contienen el vector de expresion de la presente 

15 invention pueden ser utilizadas para la sobreproduccion de las proteinas con actividad 
TGasa codificadas por la molecula de ADN de la presente invention. Un objeto 
particular de la presente invention lo constituye una proteina con actividad TGasa, entre 
otras, con una secuencia de amino&cidos segun se describe en la SEQ ID NO 2 y SEQ 
ID NO 4. 

20 Estos resultados permiten abrir nuevas posibilidades de transfonnar un sistema 

bacteriano GRAS (Generally Recognized as Safe) o una levadura que serviria, a traves 
de la expresion heterology para producir las mencionadas nuevas proteinas TGasas. 
Como se ha indicado anteriormente una proteina con actividad TGasa puede ser utlizada 
en multiples procesos de manipulation, procesamiento y transformation de alimentos 

25 gracias a su capacidad de crear uniones covalentes entre proteinas distintas. Esta 
propiedad se ha usado por ejemplo para mantener la textura de alimentos como pescado 
y carnes, reduciendo la necesidad de utilizar sales vease patente US5928689 "Method 
for treating PSE meat with transglutaminase", WO0162888 "Improved composition of 
marine product"; para la formulation de gelatinas de distinta densidad; para preparar 

30 cocinados con menos grasas (tofii) vease US 6342256 "Tofu products excellent in 
freeze resistance and process for producing the same", US6042851 "Process for 
producing packed tofu". Tambien es capaz de mantener la consistencia, elasticidad, 
humedad o viscosidad de un producto en diferentes temperaturas. Se usa asimismo en 
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distintos procesados lacticos: quesos (US6270814 "Incorporation of whey into process 
cheese", solicitud US20010053398 "Cheese whey protein having improved texture 
process for producing the same and use thereof "), yogures, helados, mayonesas, salsas 
5 y en la production de fideos (EP0948905 "Enzyme preparations comprising 
transglutaminase and process for producing noodles", US6106887 "Process for 
obtaining a modified cereal flour"), de chocolate (US6063408 "Process for producing 
chocolate"), de productos derivados a partir de patata (solicitud US20020004085 
"Methods for producing potato products"), de aziicar (JP2000354498 "Production of 

10 sugar from cereal flour material by transglutaminase treatment"). Los distintos usos, 
entre otros, descritos en las patentes anteriores para las TGasas son ejemplos de los 
potenciales usos de las TGasas de la presente invention. Por lo tanto, un objeto 
particular de la presente invention es la utilization de las proteinas con actividad TGasa 
de la presente invention, entre otras, las proteinas SEQ ID NO 2 y SEQ ID NO 4, o 

15 soluciones que las contengan, en la manipulation, preparation y transformation de 
alimentos. A continuation se indica como ejemplo de las aplicaciones de las proteinas 
con actividad TGasa de la presente invenci6n la revision de Chiya Kuraishi et al, 2001 
(Transglutaminase: Its utilization in the food industry Food Reviews International 17 
(2): 221-246). 

20 Finalmente, existen otras aplicaciones distintas de las comentadas anteriormente 

de las proteinas con actividad TGasa de la presente invention y de las que se indican 
como ilustraci6n de dichas aplicaciones las siguientes patentes, entre otras: 
-"Method for enzymatic treatment of wool" Patente USA. Appl. N° 161824 (1998) 
MacDevitt et al, April 2000. 

25 -"Enzymatically protein encapsulating oil particles by complex coacervation" Appl. N° 
791953 (1997). Soper, Jon C. Et al. March 2000. 

-" Cross-linked gelatin gels and methods of making them" Appl. N° 641463 (1996) 
Bishop, P.D. et al. ZymoGenetics, Inc.(Seattle, WA. USA). 

-"Process for obtaining a modified cereal flour'' Appl. N° 977575 Ajinomoto Co. Inc 
30 (Tokyo JP). Yamazaki et al. August 2000. 

-"Microbial transglutaminase, their production and use" Appl. N° 294565, (1999). 
NovoNordisk A/S (Bagsvaerd, DK) Bech et al. Feb. 2001. 
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Adem£s, la molecula de ADN o vector de expresi6n de la invention pueden 
emplearse en procedimientos de transformation genetica de plantas con finalidades 
tanto de investigation fundamental y en el desarrollo de plantas transgenicas con nuevas 
5 capacidades provocadas por la manipulaci6n de las funciones atribuidas a dicha TGasa 
(crecimiento y desarrollo de la planta, morfog6nesis, fotosmtesis y muerte celular) 
mediante la alteraci6n de la expresion de dichas protemas. 



DESCRIPCION DE LAS FIGURAS 

10 Figura 1.- Actividad TGasa (medida en pmol de Put incorporada) de un extracto 
proteico correspondiente a cada uno de los productos de lisis fagica descrito en el 
apartado de metodologia, correspondientes a los fagos positivos fl y £2 (que contienen 
un distinto cDNA de TGasa de maiz: fl= SEQ ID NO 1 y £2= SEQ ID NO 3) y al fago 
negativo f3 (que no contiene ningun cDNA de TGasa). Ademas, se muestra el efecto de 

15 distintos factores que influyen sobre la actividad TGasa de los extractos, descritos como 
propios de dicha actividad enzimatica TGasa en otros sistemas: Calcio= el extracto 
proteico y en ausencia de calcio. GTP= adicion de 1 mM de GTP. M)C= adici6n de 1 
mM de MDC. 

Figura 2.- Actividad de los dos extractos proteicos correspondientes a los dos fagos 
20 independientes que contienen los dos cDNA de la TGasa (fl= SEQ ID N° 1; £2= SEQ 
ID N° 2), frente a un fago que no contiene ninguno de estos cDNA (£3), con respecto a 
la cantidad de proteina del ensayo. La actividad se mide en miliunidades (mU) de 
TGasa, por incorporation de biotincadaverina, como se describe en el apartado de 
metodologia. 

25 a= 40 mg protema/ml. b= 60 mg prot/ml. c= 80 mg prot./ml. 
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E JEMPLOS DE LA INVENCION 

Ejemplo 1.- Aislamiento y clonaje de dos cDNA que codifican para dos proteinas 
de la familia de transglutaminasas de maiz mediante inmunocribado. 

Banco de expresion. 

Los cDNA de la presente invention, fueron aislados a partir de un banco de expresion 
de cDNA, en Lambda-ZAP II ®, construida con las dianas EcoRI y Xhol, partiendo de 
ARN mensajero de plSntulas de dos semanas de edad de Zea mays subsp. mays, cultivar 
homocigoto B73, creciendo bajo condiciones de invemadero (donada por la Dra. Alice 
Barkan, de la Universidad de Oregon, USA). 
Anticuerpo utilizado en el inmunocribado 

Se utiliz6 como antigeno una transglutaminasa vegetal de 58 kDa purificada a partir de 
extractos de cloroplastos de hojas de Helianthus tuberosus. Se obtuvo un anticuerpo 
policlonal en gallina (Villalobos, E., Tome, J.M., Olles, C, Claparols, I. & Santos, 
M.A. 2001. Subcellular localization of a transglutaminase related to grana development 
in different maize cell types. Protoplasma. 216: 155-163). La especificidad del 
anticuerpo se determino por la tecnica de "dot blot", utilizando transglutaminasa 
comercial de higado de cerdo, asi como por western blot con proteina purificada 
(Dondini, L. 1998. Poliammine legate e transglutaminasi nelle plante. PhD tesis. 
Universidad de Bolonia. Italia). La titulaci6n se realizo mediante la tecnica de western 
blot. (La metodologia completa se detalla en nuestro trabajo: Villalobos, E., Torn6, 
J.M., Olles, C, Claparols, L & Santos, M.A. 2001. Subcellular localization of a 
transglutaminase related to grana development in different maize cell types. 
Protoplasma. 216: 155-163). 
Inmunocribado del banco. 

Una vez conocido el titulo del banco utilizado, se inocula una colonia de la cepa XL- 
Blue® en medio LB liquido conteniendo MgS04 (1M) y maltosa al 20%. 
Despues de cultivar las bacterias hasta alcanzar una DO de 2,0 (600 nm), se realiza la 
mezcla del cultivo bacteriano con 4,5 x 10 4 pfu de la libreria, a la que se anade IPTG 10 
mM. Despues de la infecci6n e inoculation en placas con el medio LB + 10 mM de 
MgS04, se coloca sobre ellas un disco de nitrocelulosa saturado con 10 mM de IPTG. 
Despues de incubar las placas con el filtro durante 4 horas, se enfiian y se lava el filtro 
con PBS. Finalmente, una vez bloqueada la membrana con leche desnatada o BSA, se 
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procede al revelado y marcado con anticuerpo. Para detectar las lisis donde se 
encuentran los fagos positivos que han de interaccionar con el anticuerpo contra la 
Transglutaminasa de H. tuberosus, se realiza un analisis western blot de dicha 
membrana y se revela en placa fotografica, mediante el reactivo ECL. 
Excision in vivo de los fagemidos en pBluescript SK- y selection de colonias positivas. 
Una vez aislados y purificados los dos fagos, que contienen los cDNAs que codifican 
respectivamente para una proteina que interacciona con el anticuerpo, se procede a su 
excision mediante el sistema "ExAssist™ Interference-Resistant Helper Phage 
(Stratagene)". La coinfeccion se realiz6 en cepas XLl-Blue y la infection en cepas 
XLOLR®. El plaqueo se realiza en un medio selectivo que determina el vector utilizado 
(pBluescript). En nuestro caso, el medio de cultivo que selecciona las colonias 
transformantes es LB-agar adicionado con Ampicilina (50 jag/ml), IPTG 1 mM y el 
sustrato X-Gal (40 jxg/ml), del enzima p-galactosidasa, cuyo gen es interrumpido por el 
inserto o cDNA. 

Aislamiento de pldsmidos a pequena escala (MINIPREP). 

Para cada excision, el aislamiento del ADN plasmidico, que contiene el cDNA de 
interns, se realiza mediante la tecnica de MINIPREP a pequena escala de la lisis 
bacteriana utilizando SDS y NaOH, neutralizada con acetato de potasio, y purificada 
con una mezcla de fenol:cloroformo:isoamil-alcoliol (25:24:1) y precipitando con 
etanol. Posterionnente se resuspende en Tampon TE IX adicionado con el enzima 
ARNasa. 

Comprobacion de la presencia de cDNA en el vector pBluescript. 

En cada caso, la comprobacion de la presencia del inserto en el pBluescript se realiza 
mediante digestiones de una muestra del ADN plasmidico, obtenido con las mismas 
enzimas endonucleasas con las que se construy6 el banco (EcoRI y Xhol). La digestion 
se realiza segiin los requerimientos de cada enzima de restricci6n (Tampon y 
temperatura). Una vez realizada la digestion, el cDNA o inserto ha quedado liberado del 
vector. Esto se verifica con una electroforesis convencional en gel de agarosa 0.5 % en 
Tampon TBE IX o TAE IX. 

Secuenciacion (Servicio de Secuenciacion del IBMB, CSIC de Barcelona). 

Una vez identificadas las muestras de las minipreparaciones que contienen los cDNA de 

interes, que resultaron ser dos en nuestro caso, se precipitan y purifican mediante el uso 
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de la mezcla de fenol, cloroformo y alcohol isoamflico y cloroformo puro antes del 
proceso de secuenciacion. Las muestras a secuenciar se disovieron en agua. 
Determination de la secuencia codificante completa mediante la tecnica de RACE 

5 Las excisiones de los dos fagos en pBluescript SK-, permitieron obtener dos cDNA 
parciales cuya secuencia codificante completa se definio mediante la tecnica de RACE. 
Para ello, a partir de ARN total extraido de hoja de malz, se obtiene el ARN mensajero 
purificado por columna de polydT, el cual se emplea como molde para la sintesis de 
ADN de cadena sencilla. Para ello, se utiliza un oligonucleotido especifico deducido de 

10 la secuencia de cDNA conocida (el oligo El, 3'-5': GATTCTCCCTGATAAG, SEQ ID 
NO 5) y el enzima transcriptasa inversa. Despues de anadir al ADN de cadena sencilla 
una cola de poliT mediante el enzima terminal deoxytransferase" (TdT), se procede a 
obtener la segunda cadena de ADN. Esto se realiza mediante la tecnica de PCR 
utilizando el oligonucleotido 5' RACE Abridged Anchor Primer (GIBCO BRL®), 

15 especifico para ADN con cola de poliT (oligo ANCHOR 5 '-3': 
GGCCAGGCGTCGACTAGTACGGGIIGGGIIGGGnG, SEQ ID NO 6) y un segundo 
oligonucleotido especifico del cDNA partial de secuencia conocida, detallado 
anterionnente, y que corresponde al oligo E2 3'-5': GTTCTCCAGCATCTCCAG, SEQ 
ID NO 7). 

20 Con los subsiguientes ciclos de PCR se amplifica dicho ADN. La secuencia de 

los ciclos fue la siguiente: primero 2 minutos a 94°C y seguidamente 34 ciclos de: 30 
segundos a 94 °C, 30 segundos a 46 °C para el oligo n°l, pero 30 segundos a 60 °C para 
el oligo n°2, seguidos en ambos casos de 7 minutos a 72 °C. Finalmente se deja unas 
horas a 5 °C. 

25 El producto de PCR se clona en un vector adecuado (como es el pGEMT), 

utilizando el enzima ligasa. A continuation, se transforman cepas de E. coli del tipo 
DH5-alfa y se crecen las bacterias en un medio selectivo. Se extrae el ADN plasmidico 
mediante la tecnica de Miniprep, ya descrita, se purifica y se secuencia el fragmento 
obtenido. En nuestro caso, para ambas secuencias parciales de cDNA, el fragmento 

30 necesario para completar la secuencia codificante resulto ser de solo cuatro nucleotides. 
Las secuencias codificantes completas de nucleotidos, incluyendo los cuatro nucleotidos 
obtenidos con la tecnica RACE, se encuentran descritas en la SEQ ID NO 1 y SEQ ID 
NO 3, respectivamente. Los vectores de expresi6n conteniendo las secuencias SEQ ID 
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NO 1 y SEQ ID NO 3 y utilizados para la transformaci6n de las celulas huesped son el 
plasmido pGEMT15 y el pGEMT21, respectivamente. 

Las secuencias de aminoacidos obtenidas a partir de las secuencias de 
nucleotides presentan homologias con los dominios del centra activo tipo 
transglutaminasa de otros sistemas descritos, no vegetales, en la zona correspondiente a 
los aminoacidos: 431-474 para la protema de SEQ ID NO 2 (60,97 kDa) y 485-528 para 
la protema de SEQ ID NO 4 (67 kDa). En estas zonas se encuentra en ambos casos una 
cistelna (Cys) descrita como aminoacido esencial para la actividad del enzima (Cys439 
en SEQ ID NO 2 y Cys493 en SEQ ID NO 4). Base de Datos consultada: 
www.ncbi.nlm.nih/). Ademas, como se indican en las secuencias SEQ ID NO 1 y SEQ 
ID NO 3 se observan unas regiones de 27 nucleotidos repetidas en tandem en ambas 
secuencias, SEQ ID NO 1 y SEQ ID NO 3, aunque en numero distinto, de 15 y 21 
repeticiones, respectivamente y con pequefias variaciones de nucleotidos entre algunas 
de ellas. Hay que destacar que estas mencionadas regiones repetidas no se nan descrito 
anteriormente en las TGasas conocidas, por lo que son caracteristicas de la mol6cula de 
ADN de la presente invention. 

Ejemplo 2.- Comprobaci6n de la actividad transglutaminasa de las proteinas 
expresadas por dichos cDNA. 

Determination de la actividad TGasa de la protema expresadapor el cDNA. 
Con cada uno de los dos clones de los fagos conteniendo los cDNA de interes, se infecta 
un cultivo de E. coli (cepa XL-Blue), en medio de cultivo LB Hquido, al que se afiade 
IPTG 10 mM. Despues de la lisis a 37°C, se cuantifica por el metodo de Lowry la 
concentraci6n de protema total del extracto (Lowry OH, Rosebrough NJ, Farr, AL& 
Randall RJ. 1951. Protein measurement with the Folin phenol reagent. J.Biol. Chem. 
193:265-275) y con el se realizan los ensayos descritos a continuation, para determinar 
su actividad transglutaminasa firente a un extracto de lisis con un fago que no contiene el 
cDNA de interes. 

1.- Metodo de detection de actividad TGasa mediante determination de las 
proteinas marcadas con putrescina tritiada. 

Se prepara un extracto enzimitico con cada uno de los extractos de lisis 
obtenidos con ambos fagos (fl que contiene la TGasa de SEQ ID NO 2 y f2 que 
contiene la TGasa de SQ ID NO 4), en una concentration de proteinas totales de 600 
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jig, y se realiza un ensayo enzimitico a 30°C durante 30 minutos. La mezcla enzimatica 
contiene, ademas del extracto proteico, 0.6 mM de putrescina, 185 kBq de putrescina 
tritiada (0.85 TBq/nmol), 20 mM de tampon Tris.ClH pH 8 y 3 mM de CaCl 2 . La 
reaction se bloquea con icido tricloracetico al 10% conteniendo 2 mM de putrescina. 
Las muestras se precipitan repetidamente y se mide la radioactividad del pellet (Bemet, 
E., Claparols, L, Dondini, L., Santos, M.A., Serafini-Fracassini, D. & Tome, J.M*. 
1999). Changes in polyamine content, arginine and ornithine decarboxylases and 
transglutaminase activities during light/dark phases (of initial differentiation) in maize 
calluses and their chloroplast. Plant Physiol Biochem. 37(12): 899-909). La actividad 
TGasa se mide en pmols de putrescina por miligramo de proteina y por hora y fue 
mayor en los extratos proteicos obtenidos de los fagos fl y f2 con respecto al extracto a 
partir de un fago que no contiene ninguno de los cDNA de estas TGasa. 

2. Metodo de detection de la actividad TGasa mediante ensayo tipo Elisa, 
utilizando CBZ-GIn-Gly como primer sustrato y biotincadaverina como segundo. 

Este ensayo consiste en un kit suministrado por la empresa Covalab®, que 
determina, a partir de pequenas cantidades de proteina total, la actividad TGasa de la 
muestra, frente a la de una TGasa comercial de higado de cerdo. El metodo detecta los 
glutamil-derivados formados a partir del peptido y de la poliamina sustrato, por 
actividad TGasa de la muestra, mediante un ensayo colorimetrico. La actividad se mide 
en Unidades de TGasa (U), considerando que 0.6 mU de TGasa comercial corresponde 
a un valor de absorbancia a 450 nm de 1 ± 0.05 OD. 

Los dos extractos proteicos correspondientes a los dos productos de lisis, 
muestran actividad tipo TGasa en los dos metodos de detection de dicha actividad 
utilizados y descritos anteriormente (fl y f2) en comparaci6n con el extracto 
proveniente de un fago que no contiene ninguno de estos cDNA (f3). Los datos se 
muestran en las Figuras 1 y 2. 

Ademas, en la Figura 1 se muestra el efecto de distintos factores sobre la 
actividad TGasa de los extractos, descritos como propios de dicha actividad enzimdtica 
TGasa en otros sistemas. Asi, la actividad de la proteina expresada disminuye 
significativamente: a] en ausencia de calcio, b] en presencia de 1 mM de GTP, c] en 
presencia de 1 mM denodansilcadaverina (MDC) y d] en el extracto de lisis con un fago 
que no posee el cDNA de interes (£3). 
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Un par cultivos de la bacteria derivada de Escherichia coli, tipo dH5a, 
transformadas con un plasmido (pBlueScript) que contiene un cDNA de maiz y 
portadoras de un plasmido que contiene el gen que codifica la proteina de secuencia 

5 SEQ ID NO 2 y SEQ ID NO 4 de maiz respectivamente, identificados como 
15TGZM02 y 21TGZM02, han sido depositados en la Coleccion Espafiola de Cultivos 
Tipo (CECT), Universidad de Valencia, Edificio de Ihvestigacion, Campus de Burjasot, 
46100 Burjasot, Valencia, Espafia, el £7? de Mayo de 2002, correspondiendoles el 
numero de deposito CECT: 5705 para 15TGZM02 y 5706 para 21TGZM02, 

10 respectivamente. 
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REIVINDICACIONES 

L- Secuencia de nucleotidos codificante de una proteina con actividad TGasa 
caracterizada porque proviene del maiz. 

2. - Secuencia de nucleotidos segun la reivindicacion 1 caracterizada por la SEQ ID NO 
1. 

3. - Secuencia de nucleotidos segun la reivindicacion 1 caracterizada por la SEQ ID NO 
3 

4. - Secuencia de nucleotidos caracterizada porque presenta, con respecto a una 
secuencia de nucleotidos segun una cualquiera de las reivindicaciones 1 a la 3, un grado 
de identidad, a nivel de nucle6tidos, de, al menos, un 60%, preferentemente de, al 
menos un 85%, o mas preferentemente de, al menos, un 95%.y porque codifica una 
proteina con actividad Tgasa. 

5. - Vector de expresi6n caracterizado porque contiene una secuencia de nucleotidos 
segun una cualquiera de las reivinidcaciones 1 a la 4. 

6. - Vector de expresi6n segun la reivinidcacion 5 caracterizado porque pertenece, entre 
otros, al siguiente grupo: plasmido pGEMTIS y el pGEMT2L 

7. - Proteina con actividad TGasa caracterizada porque esta codificada por una secuencia 
de nucleotidos segun una cualquiera de las reivindicaciones 1 a la 4. 

8. - Proteina con actividad TGasa segun la reivindicacion 7 caracterizada porque 
pertenece, entre otras, al siguiente grupo: SEQ ID NO 2 y SEQ ID NO 4. 

9. - Celula transformada caracterizada porque contiene un vector de expresion segun una 
cualquiera de las reivinidicaciones 5 y 6 y porque permite la expresion de proteinas con 
actividad TGasa, entre otras, las cepas E. coli CECT 5705 y 5706. 

10. - Uso de la celula transformada segun la reivindicaci6n 9 en procedimientos para la 
production de proteina recombinante con actividad TGasa segun una cualquiera de las 
reivindicaciones 7 y 8. 

11. - Uso de la proteina con actividad TGasa segun una cualquiera de las 
reivindicaciones 7 y 8 en la manipulaci6n, procesamiento y transformation de 
alimentos, entre otros procesos, para mantener o mejorar la textura, consistencia, 
elasticidad, humedad o viscosidad de alimentos como pescado, queso, yogures, helados, 
mayonesas y carnes, para la formulation de gelatinas de distinta densidad y para 
preparar cocinados con menos grasas. 
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12.- Uso de los vectores de expresion segun las reivindicaciones 5 y 6 en el desarrollo 
de plantas transgenicas con nuevas capacidades provocadas por la manipulation de las 
fiinciones atribuidas a dicha TGasa, entre otras, crecimiento y desarrollo de la planta, 
5 morfogenesis, fotosintesis y muerte celular. 
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Figura 1 



Actividad TGasa 

mU 




Figura 2 
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LISTA DE SECUENCIAS 

<110> CONSEJO SUPERIOR DE INVESTTGACIONES CIENTIFICAS 
Torne Cubiro, Jose Maria 
Santos Lozano, Maria Asuncion 
Talavera Baro, David 
Villalobos Amador, Enrique 
Rigau Llioveras, Juan 

<120> SECUENCIA DE NUCLEOTIDOS DE MAIZ CODIFICANTE DE UNA PROTEINA CON 
ACTIVIDAD TRANSGLUTAMINASA, Y SU USO 

<13 0> transglutaminasa de maiz 

<160> 4 

<170> Patentln version 3.1 

<210> 1 

<211> 1748 

<212> DNA 

<213> Zea mays L 

<220> 

< 2 2 1 > repeater egion 
<222> (823) . . (1228) 

<223> rpt unit (823).. (849) number rpt : 15 repeats 
<220> 

<221> 3'UTR 

<222> (1606) . . (1729) 

<223> 

<220> 

<221> polyA__site 

<222> (1730) . . (1748) 
<223> 



<220> 

<221> polyA_site 
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4B 



96 



<222> (1730) . . (1748) 
<223> 

<220> 

5 <221> CDS 

<222> (1)..(1605) 
<223> 

<300> 

10 <308> AJ421525 

<309> 2001-12-06 conf idencial hasta el 2002-12-06 

<400> 1 

atg get cat cgt gga cat eta gat gga ctg act ggc caa get cct get 
15 Met Ala His Arg Gly His Leu Asp Gly Leu Thr Gly Gin Ala Pro Ala 
15 10 15 

ctt atg cgc cat ggt tec ttc get gca ggc age etc tct age cgc tea 
Leu Met Arg His Gly Ser Phe Ala Ala Gly Ser Leu Ser Ser Arg Ser 
20 25 30 

20 cct ttg cag tct tea tec aca ctg gag atg ctg gag aac aag ctt gee 144 
Pro Leu Gin Ser Ser Ser Thr Leu Glu Met Leu Glu Asn Lys Leu Ala 

35 40 45 

atg caa act aca gaa gtg gaa aag ctt ate acg gag aat cag egg tta 192 
Met Gin Thr Thr Glu Val Glu Lys Leu He Thr Glu Asn Gin Arg Leu 
25 50 55 60 

gca tea age cat gtg gtc ttg agg cag gac att gtt gat acg gag aaa 240 
Ala Ser Ser His Val Val Leu Arg Gin Asp He Val Asp Thr Glu Lys 
65 70 75 80 

gag atg caa atg ate cgc ace cac eta ggt gaa gtt cag aca gag act 2 88 
30 Glu Met Gin Met He Arg Thr His Leu Gly Glu Val Gin Thr Glu Thr 

85 90 95 

gat ttg cag att aga gat ttg ttg gag aga ate aga tta atg gag gta 336 
Asp Leu Gin He Arg Asp Leu Leu Glu Arg He Arg Leu Met Glu Val 
100 105 HO 

35 gat ata cat agt ggt aat gta gtg aac aag gag ctt cac caa atg cat 3 84 
Asp He His Ser Gly Asn Val Val Asn Lys Glu Leu His Gin Met His 

115 120 125 

atg gag gca aag aga ctt att act gaa agg cag atg eta ace ctt gag 432 
Met Glu Ala Lys Arg Leu He Thr Glu Arg Gin Met Leu Thr Leu Glu 
40 13 0 135 14 0 



WO 03/102128 



PCT/ES03/00247 



480 



528 



576 



624 



672 



3 

ata gag gat gtg act aaa gaa tta cag aaa etc tct gec tct ggg gac 
lie Glu Asp Val Thr Lys Glu Leu Gin Lys Leu Ser Ala Ser Gly Asp 
145 150 155 160 

aat aaa age ctt cct gaa ttg ctt tct gag eta gat agg eta egg aaa 
Asn Lys Ser Leu Pro Glu Leu Leu Ser Glu Leu Asp Arg Leu Arg Lys 

165 170 175 

gag cat cat aat tta cga tct cag ttt gaa ttt gag aaa aat aca aac 
Glu His His Asn Leu Arg Ser Gin Phe Glu Phe Glu Lys Asn Thr Asn 

180 185 190 

gtc aag caa gtt gag cag atg egg aca atg gaa atg aac ttg ata acc 
Val Lys Gin Val Glu Gin Met Arg Thr Met Glu Met Asn Leu lie Thr 

195 200 205 

atg acc aaa caa get gag aag tta cgt gtt gat gtg gca aat get gaa 
Met Thr Lys Gin Ala Glu Lys Leu Arg Val Asp Val Ala Asn Ala Glu 

210 215 220 

aga egg gca caa gca get gcg get caa gca gca gca cat gca get ggt 72 0 
Arg Arg Ala Gin Ala Ala Ala Ala Gin Ala Ala Ala His Ala Ala Gly 
225 230 235 240 

gca cag gtg aca get teg cag cct gga cag etc aag eta cca egg ttt 
Ala Gin Val Thr Ala Ser Gin Pro Gly Gin Leu Lys Leu Pro Arg Phe 

245 250 255 

cag cag cag cag cca cag act cat atg cag gtg cat ata cca get acc 
Gin Gin Gin Gin Pro Gin Thr His Met Gin Val His lie Pro Ala Thr 

260 265 270 

ccc ctg cat ate age agg gag ccc agg ctg ggg cat ate age agg gtg 
Pro Leu His lie Ser Arg Glu Pro Arg Leu Gly His He Ser Arg Val 

275 280 285 

etc agg ctg ggg tat ate age agg gag ccc agg ctg ggg cat ate age 912 
Leu Arg Leu Gly Tyr He Ser Arg Glu Pro Arg Leu Gly His He Ser 

290 295 300 

agg gag ccc agg ctg ggg cat ate age agg ggg gee agg atg ggg cat 
Arg Glu Pro Arg Leu Gly His He Ser Arg Gly Ala Arg Met Gly His 
305 310 315 320 

ate age agg ggg etc agg ctg ggg cat ate age agg gag ccc agg ctg 
He Ser Arg Gly Leu Arg Leu Gly His He Ser Arg Glu Pro Arg Leu 

325 330 335 

ggg cat ate age agg gag ccc agg ctg ggg cat ate age agg gtg etc 
Gly His He Ser Arg Glu Pro Arg Leu Gly His He Ser Arg Val Leu 

340 345 350 

agg ctg ggg cat ate age agg gag ccc agg ctg ggg cat ate age agg 



768 



816 



864 



960 



1008 



1056 



1104 
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Arg Leu Gly His lie Ser Arg Glu Pro Arg Leu Gly His lie Ser Arg 

355 360 365 

ggg ccc agt ctg ggg cat ate age agg ggg ccc agg ctg ggg cat ate 1152 
Gly Pro Ser Leu Gly His lie Ser Arg Gly Pro Arg Leu Gly His lie 

370 375 380 

age agg gag ccc agg atg ggg cat ate age agg gag ccc agg atg ggg 12 00 
Ser Arg Glu Pro Arg Met Gly His lie Ser Arg Glu Pro Arg Met Gly 
385 390 395 400 

cat ate age agg gtg etc agg ctg gag cat aca act atg ctt atg atg 1248 
His He Ser Arg Val Leu Arg Leu Glu His Thr Thr Met Leu Met Met 

405 410 415 

ctg gca egg ctt atg cat atg cag gtt act ctg get ate cag ttg cag 12 96 
Leu Ala Arg Leu Met His Met Gin Val Thr Leu Ala He Gin Leu Gin 

420 425 430 

get acg cgc aaa gtg cag tgc cca act att cct atg ctg cac etc cgc 1344 
Ala Thr Arg Lys Val Gin Cys Pro Thr He Pro Met Leu His Leu Arg 

435 440 445 

age caa caa gca gcg gtg cag eta cga acg ccg cag gag gee agt atg 13 92 
Ser Gin Gin Ala Ala Val Gin Leu Arg Thr Pro Gin Glu Ala Ser Met 

450 455 460 

ggg cag ttg gta gtg ctg gat ate eta ctg ggc aag ttc age cga gca 144 0 
Gly Gin Leu Val Val Leu Asp He Leu Leu Gly Lys Phe Ser Arg Ala 
465 470 475 480 

gtg gca ctg caa atg cag cgc aag cac etc etc etc cac cac cac egg 14 8 8 
Val Ala Leu Gin Met Gin Arg Lys His Leu Leu Leu His His His Arg 

485 490 495 

cag cac cat ate ccc cca gca cat atg acc aaa cca gag gag ccc aga 153 6 
Gin His His He Pro Pro Ala His Met Thr Lys Pro Glu Glu Pro Arg 

500 505 510 

gat aaa ate tgg gat gta aac cag atg gat gtt tgc cat gca cat ttg 15 84 
Asp Lys He Trp Asp Val Asn Gin Met Asp Val Cys His Ala His Leu 

515 520 525 

ttg age aga caa ata tgg tga aatctgggat gtaaaaccag atggctgtct 1635 
Leu Ser Arg Gin He Trp 
530 

gtgcctccat cccattgact agggegtatt ttcaccaata ttgtgcctcc agtgcaattt 1695 
cttctgtgtt atatatcacc accatttgtt gagcaaaaaa aaaaaaaaaa aaa 174 8 



<210> 2 
<211> 534 
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<212> PRT 

<213> Zea mays L 

<400> 2 

Met Ala His Arg Gly His Leu Asp Gly Leu Thr Gly Gin Ala Pro Ala 

15 io 15 

Leu Met Arg His Gly Ser Phe Ala Ala Gly Ser Leu Ser Ser Arg Ser 

20 25 30 

Pro Leu Gin Ser Ser Ser Thr Leu Glu Met Leu Glu Asn Lys Leu Ala 

35 40 45 

Met Gin Thr Thr Glu Val Glu Lys Leu lie Thr Glu Asn Gin Arg Leu 

50 55 60 

Ala Ser Ser His Val Val Leu Arg Gin Asp He Val Asp Thr Glu Lys 
65 70 75 80 

Glu Met Gin Met He Arg Thr His Leu Gly Glu Val Gin Thr Glu Thr 

85 90 95 

Asp Leu Gin He Arg Asp Leu Leu Glu Arg He Arg Leu Met Glu Val 

100 105 HO 

Asp He His Ser Gly Asn Val Val Asn Lys Glu Leu His Gin Met His 

115 120 125 

Met Glu Ala Lys Arg Leu He Thr Glu Arg Gin Met Leu Thr Leu Glu 

130 135 140 

He Glu Asp Val Thr Lys Glu Leu Gin Lys Leu Ser Ala Ser Gly Asp 
145 150 155 160 

Asn Lys Ser Leu Pro Glu Leu Leu Ser Glu Leu Asp Arg Leu Arg Lys 

165 170 175 

Glu His His Asn Leu Arg Ser Gin Phe Glu Phe Glu Lys Asn Thr Asn 

180 185 190 

Val Lys Gin Val Glu Gin Met Arg Thr Met Glu Met Asn Leu He Thr 

195 200 205 

Met Thr Lys Gin Ala Glu Lys Leu Arg Val Asp Val Ala Asn Ala Glu 

210 215 220 

Arg Arg Ala Gin Ala Ala Ala Ala Gin Ala Ala Ala His Ala Ala Gly 
225 230 235 240 

Ala Gin Val Thr Ala Ser Gin Pro Gly Gin Leu Lys Leu Pro Arg Phe 

245 250 255 

Gin Gin Gin Gin Pro Gin Thr His Met Gin Val His He Pro Ala Thr 

260 265 270 

Pro Leu His He Ser Arg Glu Pro Arg Leu Gly His He Ser Arg Val 
275 280 285 
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Leu Arg Leu Gly Tyr lie Ser Arg Glu Pro Arg Leu Gly His He Ser 

290 295 300 

Arg Glu Pro Arg Leu Gly His He Ser Arg Gly Ala Arg Met Gly His 
305 310 315 320 

He Ser Arg Gly Leu Arg Leu Gly His He Ser Arg Glu Pro Arg Leu 

325 330 335 

Gly His He Ser Arg Glu Pro Arg Leu Gly His He Ser Arg Val Leu 

340 345 350 

Arg Leu Gly His He Ser Arg Glu Pro Arg Leu Gly His He Ser Arg 

355 360 365 

Gly Pro Ser Leu Gly His He Ser Arg Gly Pro Arg Leu Gly His He 

370 375 380 

Ser Arg Glu Pro Arg Met Gly His He Ser Arg Glu Pro Arg Met Gly 
385 390 395 400 

His He Ser Arg Val Leu Arg Leu Glu His Thr Thr Met Leu Met Met 

405 410 415 

Leu Ala Arg Leu Met His Met Gin Val Thr Leu Ala He Gin Leu Gin 

420 425 430 

Ala Thr Arg Lys Val Gin Cys Pro Thr He Pro Met Leu His Leu Arg 

435 440 445 

Ser Gin Gin Ala Ala Val Gin Leu Arg Thr Pro Gin Glu Ala Ser Met 

450 455 460 

Gly Gin Leu Val Val Leu Asp He Leu Leu Gly Lys Phe Ser Arg Ala 
465 470 475 480 

Val Ala Leu Gin Met Gin Arg Lys His Leu Leu Leu His His His Arg 

485 490 495 

Gin His His He Pro Pro Ala His Met Thr Lys Pro Glu Glu Pro Arg 

500 505 510 

Asp Lys lie Trp Asp Val Asn Gin Met Asp Val Cys His Ala His Leu 

515 520 525 

Leu Ser Arg Gin He Trp 
530 

<210> 3 

<211> 1910 

<212> DNA 

<213> Zea mays L 

<220> 

<221> repeat_region 
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<222> (823) . . (1389) 

<223> rpt unit (823).. (849) number rpt : 21 repeats 
<220> 

<221> CDS 

<222> (1) . . (1764) 

<223> 

<220> 

<221> polyA_site 

<222> (1892) . . (1910) 
<223> 

<220> 

<221> 3'UTR 

<222> (1765) . . (1891) 

<223> 

<400> 3 

atg get cat cgt gga cat eta gat gga ctg act ggc caa get cct get 4 8 

Met Ala His Arg Gly His Leu Asp Gly Leu Thr Gly Gin Ala Pro Ala 
15 10 15 

ctt atg cgc cat ggt tec ttc get gca ggc age etc tct age cgc tea 96 

Leu Met Arg His Gly Ser Phe Ala Ala Gly Ser Leu Ser Ser Arg Ser 

20 25 30 

cct ttg cag tct tea tec aca ctg gag atg ctg gag aac aag ctt gee 144 

Pro Leu Gin Ser Ser Ser Thr Leu Glu Met Leu Glu Asn Lys Leu Ala 

35 40 45 

atg caa act aca gaa gtg gaa aag ctt ate acg gag aat cag egg tta 192 

Met Gin Thr Thr Glu Val Glu Lys Leu lie Thr Glu Asn Gin Arg Leu 

50 55 60 

gca tea age cat gtg gtc ttg agg cag gac att gtt gat acg gag aaa 240 

Ala Ser Ser His Val Val Leu Arg Gin Asp He Val Asp Thr Glu Lys 

65 70 75 80 

gag atg caa atg ate cgc ace cac eta ggt gaa gtt cag aca gag act 2 88 

Glu Met Gin Met He Arg Thr His Leu Gly Glu Val Gin Thr Glu Thr 

85 90 95 

gat ttg cag att aga gat ttg ttg gag aga ate aga tta atg gag gta 336 
Asp Leu Gin He Arg Asp Leu Leu Glu Arg He Arg Leu Met Glu Val 
100 105 HO 
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gat ata cat agt ggt aat gta gtg aac aag gag ctt cac caa atg cat 3 84 
Asp lie His Ser Gly Asn Val Val Asn Lys Glu Leu His Gin Met His 

115 120 125 

atg gag gca aag aga ctt att act gaa agg cag atg eta acc ctt gag 432 
5 Met Glu Ala Lys Arg Leu lie Thr Glu Arg Gin Met Leu Thr Leu Glu 
130 135 140 

ata gag gat gtg act aaa gaa tta cag aaa etc tct gec tct ggg gac 4 80 
lie Glu Asp Val Thr Lys Glu Leu Gin Lys Leu Ser Ala Ser Gly Asp 
145 150 155 160 

10 aat aaa age ctt cct gaa ttg ctt tct gag eta gat agg eta egg aaa 528 
Asn Lys Ser Leu Pro Glu Leu Leu Ser Glu Leu Asp Arg Leu Arg Lys 

165 170 175 

gag cat cat aat tta cga tct cag ttt gaa ttt gag aaa aat aca aac 576 
Glu His His Asn Leu Arg Ser Gin Phe Glu Phe Glu Lys Asn Thr Asn 
15 180 185 190 

gtc aag caa gtt gag cag atg egg aca atg gaa atg aac ttg ata acc 624 
Val Lys Gin Val Glu Gin Met Arg Thr Met Glu Met Asn Leu lie Thr 

195 200 205 

atg acc aaa caa get gag aag tta cgt gtt gat gtg gca aat get gaa 672 
20 Met Thr Lys Gin Ala Glu Lys Leu Arg Val Asp Val Ala Asn Ala Glu 
210 215 220 

aga egg gca caa gca get gcg get caa gca gca gca cat gca get ggt 720 
Arg Arg Ala Gin Ala Ala Ala Ala Gin Ala Ala Ala His Ala Ala Gly 
225 230 235 240 

25 gca cag gtg aca get teg cag cct gga cag etc aag eta cca egg ttt 768 
Ala Gin Val Thr Ala Ser Gin Pro Gly Gin Leu Lys Leu Pro Arg Phe 

245 250 255 

cag cag cag cag cca cag act cat atg cag gtg cat ata cca get acc 816 
Gin Gin Gin Gin Pro Gin Thr His Met Gin Val His lie Pro Ala Thr 
30 260 265 270 

ccc ctg cat ate age agg gag ccc agg ctg ggg cat ate age agg gtg 864 
Pro Leu His lie Ser Arg Glu Pro Arg Leu Gly His lie Ser Arg Val 

275 280 285 

etc agg ctg ggg tat ate age agg gag ccc agg ctg ggg cat ate age 912 
35 Leu Arg Leu Gly Tyr lie Ser Arg Glu Pro Arg Leu Gly His lie Ser 
290 295 300 

agg gag ccc agg ctg ggg cat ate age agg ggg gee agg atg ggg cat 960 
Arg Glu Pro Arg Leu Gly His lie Ser Arg Gly Ala Arg Met Gly His 
305 310 315 320 

40 ate age agg ggg etc agg ctg ggg cat ate age agg gag ccc agg ctg 1008 
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He Ser Arg Gly Leu Arg 
325 

ggg cat ate age agg gag 
Gly His He Ser Arg Glu 
340 

agg ctg ggg cat ate age 
Arg Leu Gly His He Ser 
355 

gaa ccc agg ctg ggg cat 
Glu Pro Arg Leu Gly His 
370 

age agg ggg gee agg atg 
Ser Arg Gly Ala Arg Met 
385 390 
cat ate age agg gag ccc 
His He Ser Arg Glu Pro 
405 

ctg ggg cat ate age agg 
Leu Gly His He Ser Arg 
420 

ccc agg ctg ggg cat ate 
Pro Arg Leu Gly His He 
435 

agg gag ccc agg atg ggg 
Arg Glu Pro Arg Met Gly 
450 

aca act atg ctt atg atg 
Thr Thr Met Leu Met Met 
465 470 
ctg get ate cag ttg cag 
Leu Ala He Gin Leu Gin 
485 

cct atg ctg cac etc cgc 
Pro Met Leu His Leu Arg 
500 

ccg cag gag gee agt atg 
Pro Gin Glu Ala Ser Met 
515 

ggc aag ttc age cga gca 
Gly Lys Phe Ser Arg Ala 
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Leu Gly His He Ser Arg 
330 

ccc agg ctg ggg cat ate 
Pro Arg Leu Gly His He 
345 

agg gtg etc agg ctg ggg 
Arg Val Leu Arg Leu Gly 
360 

ate age agg gag ccc agg 
He Ser Arg Glu Pro Arg 
375 380 
ggg cat ate age agg ggg 
Gly His He Ser Arg Gly 
395 

agg ctg ggg cat ate age 
Arg Leu Gly His He Ser 
410 

ggg ccc agt ctg ggg cat 
Gly Pro Ser Leu Gly His 
425 

age agg gag ccc agg atg 
Ser Arg Glu Pro Arg Met 
440 

cat ate age agg gtg etc 
His He Ser Arg Val Leu 
455 460 
ctg gca egg ctt atg cat 
Leu Ala Arg Leu Met His 
475 

get acg cgc aaa gtg cag 
Ala Thr Arg Lys Val Gin 
490 

age caa caa gca gcg gtg 
Ser Gin Gin Ala Ala Val 
505 

ggg cag ttg gta gtg ctg 
Gly Gin Leu Val Val Leu 
520 

gtg gca ctg caa atg cag 
Val Ala Leu Gin Met Gin 



Glu Pro Arg Leu 
335 

age agg gtg etc 1056 
Ser Arg Val Leu 
350 

tat ate age agg 1104 

Tyr He Ser Arg 

365 

ctg ggg cat ate 1152 
Leu Gly His He 

etc agg ctg ggg 120 0 
Leu Arg Leu Gly 
400 

agg gag ccc agg 1248 
Arg Glu Pro Arg 
415 

ate age agg ggg 12 96 
He Ser Arg Gly 
430 

ggg cat ate age 1344 

Gly His He Ser 

445 

agg ctg gag cat 13 92 
Arg Leu Glu His 

atg cag gtt act 144 0 
Met Gin Val Thr 
480 

tgc cca act att 1488 
Cys Pro Thr He 
495 

cag eta cga acg 15 3 6 
Gin Leu Arg Thr 
510 

gat ate eta ctg 1584 

Asp He Leu Leu 

525 

cgc aag cac etc 163 2 
Arg Lys His Leu 
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530 535 540 

etc etc cac cac cac egg cag cac cat ate ccc cca gca cat atg ace 168 0 
Leu Leu His His His Arg Gin His His He Pro Pro Ala His Met Thr 
545 550 555 560 

5 aaa cca gag gag ccc aga gat aaa ate tgg gat gta aac cag atg gat 172 8 
Lys Pro Glu Glu Pro Arg Asp Lys He Trp Asp Val Asn Gin Met Asp 

565 570 575 

gtt tgc cat gca cat ttg ttg age aga caa ata tgg tgaaatctgg 1774 
Val Cys His Ala His Leu Leu Ser Arg Gin He Trp 
10 580 585 

gatgtaaaac cagatggctg tctgtgcctc catcccattg actagggegt attttcacca 1834 
atattgtgcc tccagtgcaa tttcttctgt gttatatatc accaccattt gttgggcaaa 1894 
aaaaaaaaaa aaaaaa 1910 



15 <210> 4 

<211> 588 

<212> PRT 

<213> Zea mays L 

20 <400> 4 

Met Ala His Arg Gly His Leu Asp Gly Leu Thr Gly Gin Ala Pro Ala 
1 5 10 15 

Leu Met Arg His Gly Ser Phe Ala Ala Gly Ser Leu Ser Ser Arg Ser 
20 25 30 

25 Pro Leu Gin Ser Ser Ser Thr Leu Glu Met Leu Glu Asn Lys Leu Ala 
35 40 45 

Met Gin Thr Thr Glu Val Glu Lys Leu He Thr Glu Asn Gin Arg Leu 

50 55 60 

Ala Ser Ser His Val Val Leu Arg Gin Asp He Val Asp Thr Glu Lys 
30 65 70 75 80 

Glu Met Gin Met He Arg Thr His Leu Gly Glu Val Gin Thr Glu Thr 

85 90 95 

Asp Leu Gin He Arg Asp Leu Leu Glu Arg He Arg Leu Met Glu Val 
100 105 110 

35 Asp He His Ser Gly Asn Val Val Asn Lys Glu Leu His Gin Met His 
115 120 125 

Met Glu Ala Lys Arg Leu He Thr Glu Arg Gin Met Leu Thr Leu Glu 

130 135 140 

He Glu Asp Val Thr Lys Glu Leu Gin Lys Leu Ser Ala Ser Gly Asp 
40 145 150 155 160 
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Asn Lys Ser Leu Pro Glu Leu Leu Ser Glu Leu Asp Arg Leu Arg Lys 

165 170 175 

Glu His His Asn Leu Arg Ser Gin Phe Glu Phe Glu Lys Asn Thr Asn 
180 185 190 

5 Val Lys Gin Val Glu Gin Met Arg Thr Met Glu Met Asn Leu lie Thr 
195 200 205 

Met Thr Lys Gin Ala Glu Lys Leu Arg Val Asp Val Ala Asn Ala Glu 

210 215 220 

Arg Arg Ala Gin Ala Ala Ala Ala Gin Ala Ala Ala His Ala Ala Gly 
10 225 230 235 240 

Ala Gin Val Thr Ala Ser Gin Pro Gly Gin Leu Lys Leu Pro Arg Phe 

245 250 255 

Gin Gin Gin Gin Pro Gin Thr His Met Gin Val His He Pro Ala Thr 
260 265 270 

15 Pro Leu His lie Ser Arg Glu Pro Arg Leu Gly His He Ser Arg Val 
275 280 285 

Leu Arg Leu Gly Tyr He Ser Arg Glu Pro Arg Leu Gly His He Ser 

290 295 300 

Arg Glu Pro Arg Leu Gly His He Ser Arg Gly Ala Arg Met Gly His 
20 305 310 315 320 

He Ser Arg Gly Leu Arg Leu Gly His He Ser Arg Glu Pro Arg Leu 

325 330 335 

Gly His He Ser Arg Glu Pro Arg Leu Gly His He Ser Arg Val Leu 
340 345 350 

25 Arg Leu Gly His He Ser Arg Val Leu Arg Leu Gly Tyr He Ser Arg 
355 360 365 

Glu Pro Arg Leu Gly His He Ser Arg Glu Pro Arg Leu Gly His He 

370 375 380 

Ser Arg Gly Ala Arg Met Gly His He Ser Arg Gly Leu Arg Leu Gly 
30 385 390 395 400 

His He Ser Arg Glu Pro Arg Leu Gly His He Ser Arg Glu Pro Arg 

405 410 415 

Leu Gly His He Ser Arg Gly Pro Ser Leu Gly His He Ser Arg Gly 
420 425 430 

35 Pro Arg Leu Gly His He Ser Arg Glu Pro Arg Met Gly His He Ser 
435 440 445 

Arg Glu Pro Arg Met Gly His He Ser Arg Val Leu Arg Leu Glu His 

450 455 460 

Thr Thr Met Leu Met Met Leu Ala Arg Leu Met His Met Gin Val Thr 
40 465 470 475 480 
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Leu Ala lie Gin Leu Gin Ala Thr Arg Lys Val Gin Cys Pro Thr He 

485 490 495 

Pro Met Leu His Leu Arg Ser Gin Gin Ala Ala Val Gin Leu Arg Thr 
500 505 510 

5 Pro Gin Glu Ala Ser Met Gly Gin Leu Val Val Leu Asp He Leu Leu 
515 520 525 

Gly Lys Phe Ser Arg Ala Val Ala Leu Gin Met Gin Arg Lys His Leu 

530 535 540 

Leu Leu His His His Arg Gin His His He Pro Pro Ala His Met Thr 
10 545 550 555 560 

Lys Pro Glu Glu Pro Arg Asp Lys He Trp Asp Val Asn Gin Met Asp 

565 570 575 

Val Cys His Ala His Leu Leu Ser Arg Gin He Trp 
580 585 



15 



20 



<210> 5 

<211> 16 

<212> DNA 

<213> Artificial sequence 



<220> 

<223> Oligonucleotido El 
<400> 5 

25 gattctccct gataag 16 

<210> 6 

<211> 36 

<212> DNA 

30 <213> Artificial sequence 

<220> 

<223> Oligonucleotido ANCHOR 
35 <400> 6 

ggccaggcgt cgactagtac gggiigggii gggiig 3 6 



40 



<210> 7 
<211> 18 
<212> DNA 
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<213> Artificial sequence 
<220> 

<223> Oligonucleotide E2 



<400> 7 

gttctccagc atctccag 



18 
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